Hiérarchisation des règles d'association en fouille de textes
نویسندگان
چکیده
Résumé. L’extraction de règles d’association est souvent exploitée comme méthode de fouille de données. Cependant, une des limites de cette approche vient du très grand nombre de règles extraites et de la difficulté pour l’analyste à appréhender la totalité de ces règles. Nous proposons donc de pallier ce problème en structurant l’ensemble des règles d’association en hiérarchies. La structuration des règles se fait à deux niveaux. Un niveau global qui a pour objectif de construire une hiérarchie structurant les règles extraites des données. Nous définissons donc un premier type de subsomption entre règles issue de la subsomption dans les treillis de Galois. Le second niveau correspond à une analyse locale des règles et génère pour une règle donnée une hiérarchie de généralisation de cette règle qui repose sur des connaissances complémentaires exprimées dans un modèle terminologique. Ce niveau fait appel à un second type de subsomption inspiré de la subsomption en programmation logique inductive.
منابع مشابه
Fouille de textes hiérarchisée appliquée à la détection de fautes
This paper presents an original text mining approach based on text segmented units, mixing data mining techniques and text linguistics. First, we describe the text units and their descriptors designed for detecting mistakes in scientific papers in English. These include text organisation, emphasizing the relative positions and the context of stylistic markers. Secondly, the paper explains the t...
متن کاملLe rôle de l'utilisateur dans un processus d'extraction de règles d'association
Résumé. De nombreux travaux ont porté sur l'extraction de règles d'association. Cependant, cette tâche continue à intéresser les chercheurs en fouille de données car elle soulève encore plusieurs défis. En particulier, son utilisation en pratique reste difficile : d'une part, le nombre de règles apprises est souvent très grand, d'autre part, le traitement des valeurs numériques dans cette tâche...
متن کاملUtilisation des réseaux bayésiens dans le cadre de l'extraction de règles d'association
Résumé. Cet article aborde le problème de l’utilisation d’un modèle de connaissance dans un contexte de fouille de données. L’approche méthodologique proposée montre l’intérêt de la mise en œuvre de réseaux bayésiens couplée à l’extraction de règles d’association dites delta-fortes (membre gauche minimal, fréquence minimale et niveau de confiance contrôlé). La découverte de règles potentielleme...
متن کاملRègles d'association avec une prémisse composée : mesure du gain d'information
La communauté de fouille de données a développé un grand nombre d’indices permettant de mesurer la qualité des règles d’association (RA) selon diverses sémantiques (Guillet, 2004). Cependant ces sémantiques, qui permettent d’interpréter les règles simples, s’avèrent d’utilisation trop complexe pour un expert dans le cas de règles à prémisse composée. Notre objectif est donc de sélectionner les ...
متن کاملExtraction de règles d'association quantitatives - Application à des données médicales
Résumé. L’extraction de règles d’association est devenue aujourd’hui une tâche populaire en fouille de données. Cependant, l’algorithme Apriori et ses variantes restent dédiés aux bases de données renfermant des informations catégoriques. Nous proposons dans cet article QuantMiner, qui est un outil que nous avons développé dans le but d’extraire des règles d’association gérant variables catégor...
متن کامل